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摘 要 在 日 常生 活 中 ,从 “第 三 人 称 ” 的 视角 识别 并 理解 他 人 的 社会 互动 至 关 重 要 。 这 种 社会 
互动 加 工具 有 两 种 认 知 特性 : 构 形 整体 性 和 动作 关联 性 ; 体现 为 一 个 由 众多 脑 区 共同 参与 的 
层级 加 工 过 程 ， 主 要 包括 个 体 知 觉 网 络 、 动 作 观 察 网 络 和 心智 化 网 络 。 其 中 ， 后 里 上 沟 等 脑 
区 在 表征 社会 互动 关系 中 起 着 关键 作用 。 未 来 的 研究 需要 结合 多 种 技术 手段 进一步 揭示 社会 


© 互动 加 工 的 遗传 特性 和 神经 机 制 ， 并 关注 它 在 实际 生活 中 的 应 用 。 
z 关键 词 社会 互动 ; 第 三 人 称 视角 ; 构 形 加 工 ; 动作 关联 性 ; 脑 机制 
分 类 号 B842 
1 引言 


社会 互动 (social interaction) 是 指 个 体 通过 动作 或 语言 表达 某 种 交流 的 意图 ， 而 对 方 理解 
这 种 意图 并 做 出 恰当 的 回应 , 从 而 达成 有 意义 的 社会 交流 过 程 (Capozzi & Ristic, 2018; Hauser 
& Wood, 2010). 在 日 常生 活 中 ,社会 互动 无 处 不 在 ,与 朋友 聊天 、 与 舞伴 跳舞 、 与 对 手 格斗 
都 属于 不 同形 式 的 社会 互动 。 研 究 社 会 互动 有 两 种 不 同 的 视角 : “第 二 人 称 ” 视 角 (second- 


person perspective) 和 “第 三 人 称 ” 视 角 (third-person perspective)。“ 第 二 人 称 ” 视 和 角 的 研究 一 般 通 


过 创造 实时 的 互动 情境 ， 考 察 被 试 与 他 人 直接 进行 互动 时 的 认 知 过 程 (Caruana, McArthur, 


Woolgar, & Brock, 2017; Schilbach et al., 2013)。 与 之 相对 , “第 三 人 称 ” 视 角 的 研究 主要 关注 
被 试 作为 旁观 者 ， 在 观察 他 人 进行 社会 互动 时 的 认 知 过 程 (Quadflieg & Koldewyn, 2017)， 包 
得 对 互动 双方 特征 的 知觉 和 意图 的 推断 等 .观察 并 理解 他 人 的 社会 互动 不 仅 对 于 人 类 的 生存 
进化 具有 重要 的 意义 , 而 且 在 我 们 的 日 常生 活 中 起 着 重要 的 作用 。 它 提 供 了 个 体 观 察 学 习 的 
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机 会 ， 有 助 于 个 体 更 好 地 了 解 他 人 的 个 性 特征 和 社会 关系 ， 从 而 加 深 对 社会 群体 的 理解 ， 提 


高 社会 交往 的 技能 (Matheson, Moore, & Akhtar, 2013; Milinski, 2016). 

近年 来 ， 越 来 越 多 的 研究 从 “第 三 人 称 ” 视 角 来 探究 社会 互动 , 这 既 可 以 揭示 人 类 加 工 他 
人 互动 的 认 知 神经 机 制 , 同时 也 为 特殊 人 群 的 诊断 鉴定 和 识别 社会 互动 的 人 工 智能 算法 提供 
了 参考 ， 因 此 具有 重要 的 理论 意义 和 应 用 价值 。 本 文 从 “第 三 人 称 ” 视 角 出 发 ,论述 了 社会 互 
动 加 工 的 前 提 条 件 和 认 知 特性 , 并 在 梳理 了 社会 互动 加 工 的 认 知 神经 机 制 的 基础 上 , 探讨 了 
需要 进一步 研究 的 科学 问题 。 因 此 ， 下 文 提 到 的 社会 互动 特 指 “第 三 人 称 ” 视 角 的 社会 互动 。 


2 社会 互动 加 工 的 前 提 条 件 


jm 社会 互动 具有 多 种 多 样 的 呈现 方式 ， 既 包括 简短 的 视频 (Sinke, Sorger, Goebel, & de 


O Gelder, 2010)， 静 止 的 图 片 (Quadflieg, Gentile, & Rossion, 2015)， 也 包括 将 人 物 抽象 成 关节 点 


© 的 光 点 动画 (Manera, Schouten, Becchio, Bara, & Verfaillie, 2010) 和 只 具备 生物 运动 模式 的 简 


一 : 单 几何 图 形 (Gao, Scholl, & McCarthy, 2012)。 人 们 仅仅 通过 观察 这 些 社会 互动 的 刺激 ， 就 可 


m 以 判断 出 双方 是 否 在 进行 互动 ， 有 具体 在 进行 哪 种 互动 (Manera, von der Luhe, Schilbach, 


Verfaillie, & Becchio, 2016), 进而 可 以 推断 他 们 是 友好 还 是 敌对 (Wu, Hua, Yang, & Yin, 2018), 


关系 是 否 亲密 (Costanzo & Archer, 1989)， 或 者 彼此 的 社会 地 位 是 否 相 同等 多 种 社会 信息 


(Floyd & Erbert, 2003; Mast & Hall, 2004). 


不 管 以 哪 种 方式 呈现 ， 只 有 同时 满足 空间 、 时 间 及 意义 维度 上 的 前 提 条 件 ， 两 个 个 体 才 
会 被 知觉 为 正在 进行 社会 互动 。 具 体 而 言 ， 在 空间 维度 上 ， 两 个 个 体 的 空间 距离 和 身体 朝向 
都 会 影响 观察 者 对 社会 互动 的 感知 。 最 近 的 研究 发 现 两 个 个 体 的 距离 越 近 , 身体 越 是 朝向 对 
方 ， 他 们 被 判断 为 正在 互动 的 可 能 性 就 越 大 (Hartmann et al., 2019; Zhou, Han, Liang, Hu, & 
Kuai, 2019)。 在 时 间 维 度 上 ， 当 两 个 个 体 的 动作 具有 连续 性 时 ， 即 小 人 A 的 动作 完成 后 小 人 
B 做 出 及 时 的 回应 ， 他 们 更 可 能 被 认为 在 进行 社会 互动 。 而 随 着 双方 动作 时 间 间 隔 的 增 大 ， 
小 人 A 的 动作 对 小 人 B 的 预测 作用 也 会 相应 变 差 (Manera, Schouten, Verfaillie, & Becchio, 
2013)， 这 意味 着 观察 者 对 双方 互动 的 知觉 也 随 之 变 差 。 在 意义 维度 上 ， 两 个 个 体 的 动作 只 
有 形成 符合 逻辑 的 联系 , 才 有 可 能 被 认为 存在 社会 互动 关系 。 例如 ， 当 小 人 A 发 出 “站 起 来 ” 
的 动作 指令 ， 小 人 B 从 蹲 下 的 姿态 站 了 起 来 ， 两 个 小 人 会 被 知觉 为 正在 互动 ， 如 果 A 发 出 


同样 的 指令 , 而 B 从 始 至 终 一 直 在 扫地 , 他 们 就 会 被 认为 是 相互 独立 的 个 体 , 彼此 没有 互动 
(Manera et al., 2015)。 综 上 所 述 ， 距 离 相近 、 身 体 相 向 、 时 间 连 续 、 意 义 合理 都 是 感知 到 社 
会 互动 的 前 提 条 件 。 绝 大 多 数 研究 者 会 基于 上 述 前 提 条 件 之 一 ， 生 成 背 对 背 的 身体 姿态 ， 打 
乱 互 动 双方 动作 的 时 间 结 构 , 或 者 匹配 两 个 没有 逻辑 关联 的 动作 ,作为 控制 实验 的 非 社会 互 
动 刺激 。 然 而 ， 在 真实 的 社会 情境 中 ， 上 述 因 素 往往 共同 影响 着 对 社会 互动 的 判断 ， 但 
极 少数 研究 同时 考察 了 多 种 因素 在 社会 互动 知觉 中 的 作用 (Hartmann et al., 2019)， 未 来 可 从 
整合 的 视角 考察 多 种 因素 的 共同 作用 方式 。 
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3 社会 互动 加 工 的 认 知 特性 

两 个 互动 的 个 体 一 旦 被 第 三 方 知觉 为 正在 进行 社会 互动 , 他 们 在 空间 上 就 会 以 整体 构 形 
(global configuration) 的 方式 得 到 加 工 , 而 他 们 的 动作 则 会 形成 彼此 关联 且 有 意义 的 时 间 结 构 
得 到 表征 。 这 种 构 形 的 整体 性 和 动作 的 关联 性 既是 社会 互动 加 工 的 认 知 特性 , 也 是 社会 互动 


具有 加 工 优 势 的 潜在 原因 (Fedorov, Chang, Giese, Bulthoff, & de la Rosa, 2018; Neri, Luu, & 


Levi, 2006; Papeo, Goupil, & Soto-Faraco, 2019; Vestner, Tipper, Hartley, Over, & Rueschemeyer, 


2019)。 下 文 将 详细 阅 述 支持 这 两 种 认 知 特性 的 证 据 , 以 及 它们 所 带 来 加 工 优势 的 具体 表现 。 


3.1 整体 性 构 形 加 工 

社会 互动 的 整体 性 构 形 加 工 是 指 人 们 对 两 个 互动 的 个 体 所 形成 的 空间 结构 (面对面 的 身 
体 朝 向 ) 进 行 整体 表征 ， 即 互动 双方 被 当 作 一 个 结构 化 的 功能 整体 而 非 两 个 独立 的 个 体 得 到 
力 
Vestner et al., 2019)。 假 设 社会 互动 存在 整体 性 构 形 加 工 ， 那 么 互动 双方 作为 一 个 整体 必然 


- 
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工 和 存储 (Ding, Gao, & Shen, 2017; Papeo et al., 2019; Papeo, Stein, & Soto-Faraco, 2017; 


会 影响 空间 注意 的 分 配 (Shen, Yin, Ding, Shui, & Zhou, 2016; Yin, Xu, Duan, & Shen, 2018), 
表现 出 经 典 的 客体 注意 效应 (object-based attentional effect)， 即 注意 资源 会 自动 分 配 在 同一 客 
体 的 不 同 部 分 ， 对 它们 的 反应 要 快 于 对 其 它 客体 的 反应 。 在 社会 互动 情境 中 ， 当 线索 呈现 在 
一 个 小 人 身上 时 , 被 试 不 仅 对 同一 小 人 身上 的 目标 反应 更 快 , 对 与 他 互动 小 人 身上 的 目标 反 
应 也 快 于 其 他 小 人 身上 的 目标 ;而 此 效应 在 非 互 动 的 情景 下 消失 (Ji, Yin, Huang, & Ding, in 
press)。 不 仅 如 此 ， 社 会 互动 的 整体 性 构 形 加 工 还 直接 体现 在 由 于 互动 双方 被 知觉 为 一 个 整 


体 ， 他 们 的 主观 距离 比 实际 距离 更 近 (Vestner et al., 2019). 


在 整体 性 构 形 加 工 中 , 互动 双方 的 空间 结构 以 整体 的 方式 得 到 表征 。 相 比 于 对 局 部 空间 


AMIGA IL, 这 种 整体 加 工 的 方式 在 一 定 程 度 上 减少 了 认 知 负荷 ， 从 而 使 互动 刺激 比 非 


互动 刺激 具有 加 工 优 势 (Papeo et al., 2019; Papeo et al., 2017; Vestner, Gray, & Cook., 2020). 
首先 , 整体 性 构 形 加 工 有 助 于 互动 刺激 快速 通达 意识 , 被 试 识别 被 掩蔽 到 阔 下 的 两 个 面对面 
互动 小 人 的 正确 率 显 著 高 于 被 掩蔽 的 背 对 背 非 互动 小 人 ; 而 对 于 倒置 的 刺激 , 被 试 则 不 会 表 


现 出 这 种 识别 优势 (Papeo et al., 2017)。 其 次 ， 整 体 性 构 形 加 工 也 有 助 于 快速 搜索 互动 刺激 ， 
表现 出 搜索 不 对 称 性 , 即 从 一 群 背 对 背 小 人 中 搜索 面对面 小 人 比 从 一 群 面 对 面 小 人 中 搜索 背 
对 背 小 人 的 正确 率 更 高 ， 速 度 更 快 (Papeo etal., 2019)。 最 后 ， 整 体 性 构 形 加 工 还 有 利于 记忆 


的 存储 和 提取 。 不 论 在 短 时 记忆 任务 还 是 长 时 记忆 的 任务 中 , 被 试 记忆 互动 刺激 的 正确 率 都 


高 于 非 互动 刺激 (Ding et al., 2017; Vestner et al.,2019)。 以 上 这 些 研究 不 仅 证 明了 整体 性 构 形 
加 工 所 带 来 的 加 工 优势 ， 也 再 次 印证 了 社会 互动 加 工 中 存在 整体 性 构 形 表 征 。 但 是 ， 关 于 整 
体 性 构 形 加 工 是 特异 于 社会 互动 刺激 还 是 也 存在 于 其 他 面对面 的 客体 中 , 目前 还 尚未 得 出 一 


致 的 结论 (Papeo & Abassi, 2019; Vestner et al., 2020)。 假 如 整体 性 构 形 加 工 特 异 于 社会 互动 刺 


激 ， 是 否 适 用 于 所 有 类 型 (如 合作 或 竞争 ) 的 社会 互动 也 有 待 进一步 的 研究 (Yin et al., 2013). 


3.2 关联 性 动作 表征 

社会 互动 不 仅 在 空间 上 作为 一 个 整体 被 加 工 , 同时 也 是 一 个 动态 连续 的 时 间 过 程 。 在 社 
会 互动 中 , 不 论 是 社交 发 起 者 传递 交流 意图 , 回应 者 做 出 回应 (例如 , A 扔 出 东西 , B 接 住 )， 
还 是 互动 双方 通过 默契 的 配合 ， 完 成 协调 性 的 联合 动作 (Goint action, WX A SEER; Marsh, 


上 


Richardson, & Schmidt, 2009; Pesquita, Whitwell, & Enns, 2018)， 双 方 的 动作 都 是 有 联系 的 ， 
它们 共同 组 成 了 一 个 有 意义 的 、 连 续 的 时 间 结 构 , 这 使 得 互动 动作 以 相互 关联 的 形式 在 大 脑 
中 被 表征 。 有 研究 者 使 用 了 两 对 互动 动作 一 一 其 中 “ 拿 来 回应“ 给予 ”，“ 接 住 ” 回 应 “ 扔 出 ”一 
一 来 检验 观察 一 个 动作 是 否 能 够 自动 触发 与 它 相 关联 的 动作 表征 。 他们 发 现 , 给 被 试 重复 呈 
现 “ 拿 来 * 的 动作 ， 会 让 他 们 更 倾向 于 将 既 像 “ 拿 来 "又 像 “ 接 住 的 两 可 动作 知觉 成 “ 接 住 ” 的 动 
作 ; 更 为 关键 的 是 ， 即 使 重复 呈现 “给 予 * 的 动作 后 ， 被 试 也 会 把 这 个 两 可 动作 知觉 成 “ 接 住 ” 
的 动作 。 可 见 ， 尽 管 “给 予 " 与 “ 拿 来 "的 动作 存在 很 大 的 视觉 差异 ， 却 可 以 引发 相同 的 适应 结 
果 。 这 种 交叉 适应 效应 (cross-adaptation effects) 充 分 证 明了 互动 动作 存在 关联 性 的 表征 


(Fedorovetal.,2018)。 此 外 ， 关 联 性 动作 表征 的 证 据 还 体现 在 被 试 对 互动 动作 的 时 间 感 知 更 


短 (Liu, Yuan, Chen, Jiang, & Zhou, 2018)， 动 作 流畅 性 更 高 (Peng, Ichien, & Lu, 2020). 


关联 性 动作 表征 使 得 人 类 对 他 人 互动 行为 的 感知 不 仅 基 于 当前 的 视觉 输入 , 还 可 以 依赖 


先前 的 知识 经 验 和 动作 之 间 连 续 的 时 间 结 构 , 预测 接 下 来 可 能 的 动作 ,从 而 在 不 确定 性 较 高 


的 情况 下 ， 更 好 地 识别 互动 动作 (Manera, Becchio, Schouten, Bara, & Verfaillie, 2011; Manera, 


Giudice, Bara, Verfaillie, & Becchio, 2011; Neri et al., 2006; von der Luhe et al., 2016). Neri 和 


他 的 同事 (2006) 最 早 证 明了 这 种 促进 效应 。 他 们 给 被 试 先后 呈现 两 个 被 噪音 点 掩蔽 的 光 点 动 
画 ， 其 中 一 个 动画 包含 两 个 互动 或 非 互动 的 小 人 ， 另 一 个 动画 则 只 包含 其 中 的 一 个 小 人 , 结 


果 发 现 当 双人 动画 是 时 间 结 构 完整 的 互动 动画 时 , 被 试 判 断 双人 动画 的 正确 率 更 高 。 随 后 的 


研究 则 进一步 证 实 , 被 试 可 以 利用 社交 发 起 者 的 动作 来 预测 回应 者 的 动作 ,基体 表现 为 当 两 
个 小 人 A MB 中 的 回应 者 B 被 噪音 掩蔽 时 , 若 小 人 A 和 B 具有 互动 关系 , 被 试 从 噪音 中 状 


别 小 人 B 会 更 容易 (Manera, Becchio, et al., 2011; Manera, Giudice, et al., 2011; Manera et al., 


2013)。 除 了 噪音 掩蔽 范式 ， 这 种 基于 关联 性 动作 的 预测 效应 在 双眼 竞争 (binocular rivalry) 范 


式 中 也 得 到 了 验证 (Su, Van Boxtel, 妨 Lu,2016)。 尽 管 选取 了 不 同 的 实验 范式 和 多 样 的 刺激 形 
式 ， 上 述 研 究 都 得 出 了 较为 一 致 的 结论 : 关联 性 动作 表征 可 以 促进 互动 动作 的 识别 。 不 过 目 
前 的 研究 主要 以 整个 身体 的 动作 为 主 ， 较 少 关 注 手势 、 脚 部 动作 等 局 部 肢体 动作 (Zaini, 


Fawcett, White, & Newman, 2013); 而 在 跳舞 等 某 些 特定 情景 中 ， 局 部 肢体 动作 也 是 重要 的 信 


RERE, 未 来 的 研究 可 以 应 用 更 具 生 态 效 度 的 刺激 来 探索 局 部 肢体 动作 的 关联 性 表征 在 
社会 互动 中 的 作用 。 


4 社会 互动 加 工 的 脑 机 制 
作为 高 级 认 知 活动 , 社会 互动 加 工 是 一 个 从 识别 双方 身体 和 面孔 到 理解 互动 的 动作 ,从 


而 推测 其 交流 ; 


络 ( 见 


上 


图 的 层级 加 工 过 程 。 这 个 过 程 可 以 简单 分 为 三 个 阶段 , 分 别 对 应 于 三 个 脑 网 


0 


图 1): 个 体感 知 网 络 (person perception network)、 动 作 观 察 网 络 (action observation 


network) 和 心智 化 网 络 (mentalizing network)， 详 见 Quadflieg 和 Koldewyn(2017) 的 综述 。 个 


体感 知 网 络 负责 对 互动 者 的 身体 和 面孔 进行 视觉 分 析 ， 主 要 包括 特异 于 面孔 加 工 的 梭 状 


(fusiform face area, FFA)、 上 肢体 加 工 的 外 纹 状 皮层 身体 区 (extrastriate body area, EBA)、 动 态 


FLANA 


paf 


E 物 运动 加 工 的 后 显 上 沟 (posterior superior temporal sulcus, pSTS; Quadflieg et al., 2015). 
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动作 观察 网 络 属 于 镜像 神经 元 系统 (mirror neuron system, MNS), 主要 参与 对 他 人 动作 的 快速 


识别 及 意图 的 准确 理解 ， 由 前 运动 皮层 (premotor cortex, PMC)、 额 下 回 (inferior frontal gyri, 


IFG) 和 顶 下 小 叶 (inferior parietal lobule, IPL) 等 组 成 (Caspers, Zilles, Laird, & Eickhoff, 2010)。 


心智 化 网 络 是 心理 理论 (theory of mind) 的 神经 基础 , 主要 负责 判断 他 人 抽象 的 心理 状态 (如 欲 


望 、 动 机 、 意图、 观念 等 ) 和 推测 复杂 的 社会 属性 (如 社会 规范 , 亲属 关系 , 情绪 状态 等 ; Keysers 


& Gazzola, 2007)， 它 主要 包括 背 / 腹 内 侧 前 额 叶 皮层 (dorsal/ventral medial prefrontal cortex, 


dmPFC/vmPFC). si JER X (temporoparietal junction, TPJ))、 横 前 叶 (precuneus, PrC) 等 脑 区 


(Schurz, Radua, Aichhorn, Richlan, & Perner, 2014). 


梭 状 回 (FFA) 
后 时 上 沟 (pPSTS) 
外 纹 状 皮层 身体 区 (EBA) 


=> 前 运动 皮层 (PMC) = 背 / 腹 内 侧 前 额 叶 皮层 


额 下 回 (IFG) (dmPFC/vmPFC) 
顶 下 小 叶 (IPU) HARE (TP J) 
模 前 叶 (PrC) 


图 1 社会 互动 加 工 过 程 的 脑 网 络 。 各 个 脑 


区 分 别 对 应 着 下 方 相同 颜色 的 脑 网 络 。 


4.1 与 社会 互动 认 知 特性 相关 的 脑 区 


在 揭示 社会 互动 加 工 的 脑 
随 着 行为 范式 和 数据 处 理 方法 


网 络 时 , 研究 者 主要 关注 被 试 观看 互动 刺激 所 激活 的 脑 区 , 但 
的 发 展 , 更 多 的 研究 者 也 开始 寻找 与 社会 互动 认 知 特性 加 工 相 


关 的 脑 区 。 首 先 ， 是 否 存在 特定 的 脑 区 支持 社会 互动 的 整体 构 形 加 工 ? 已 有 证 据 提 示 ， 属 于 
个 体感 知 网 络 的 EBA 脑 区 ， 对 身体 的 姿态 信息 敏感 ， 并 基于 此 对 动作 进行 编码 (Downing， 


Peelen, Wiggett, & Tew, 2006), 


因此 可 能 是 与 社会 互动 整体 构 形 加 工 相关 的 脑 区 。 为 了 证 明 


这 个 推断 ， 研 究 者 利用 多 体 素 模式 分 析 技 术 (multivoxel pattern analysis, MVPA) 技 术 ， 训 练 分 
类 器 根据 pSTS BK EBA 的 激活 模式 来 判断 被 试 观看 互动 视频 的 类 型 (争论 、 庆 祝 或 大 笑 )， 然 


后 分 别 测试 辨别 两 人 互动 动作 以 及 其 中 单 人 动作 的 成 绩 。 测 试 结果 表明 ，PpSTS 能 够 分 辨 互 


动 动作 和 单 人 动作 ， 但 是 两 者 的 正确 


没有 显著 差异 ; 而 EBA 区 分 互动 动作 的 正确 率 要 显 


车 高 于 区 分 单 人 动作 的 正确 率 ， 这 说 明 EBA 除了 加 工 局 部 单 人 动作 ， 也 提取 了 社会 互动 独 


特 的 整体 信 
面对面 的 小 人 ， 也 就 是 说 ,在 训 


个 小 人 


息 (Walbrin & Koldewyn, 2019)。 随 后 的 研究 进一步 表明 EBA 的 整体 编码 只 限于 
练 分 类 器 对 单个 小 人 的 动作 进行 区 分 后 ， 当 这 个 小 人 与 男 一 
面对面 而 非 背 对 背 时 ， 通 过 EBA 的 激活 模式 识别 出 此 小 人 动作 的 正确 率 更 高 。 即 当 


两 个 小 人 的 身体 相向 从 而 形成 社会 互动 关系 时 ，EBA 编码 单个 小 人 身体 的 能 力也 得 到 增强 


(Abassi & Papeo, 2020)。 上 述 结果 都 订 


要 的 作 


其 


次 , 研究 者 也 关注 是 


E 明 了 EBA 在 社会 互动 的 整体 性 构 形 加 工 中 发 挥 了 重 


用 (Abassi & Papeo, 2020; Walbrin & Koldewyn, 2019). 


否 存 在 某 些 脑 区 表征 社会 互动 的 关联 性 动作 。 由 于 关联 性 动作 表 


征 涉 及 到 互动 动作 的 时 间 连 续 和 意义 关联 , 因此 可 能 与 动作 观察 网 络 和 心智 化 网 络 有 关 。 在 
社会 互动 中 ， 关 联 性 动作 相 比 于 非 关联 性 动作 (用 一 个 小 人 的 镜像 动作 替代 与 他 互动 的 另 一 
作 ) 更 强 的 激活 了 包括 IFG( 延 伸 到 PMC), pSTS 和 左 侧 IPL 等 在 内 的 动作 观察 网 络 


人 的 动 


(Georgescu et al., 2014)。 此 外 ，Zillekens 等 人 (2019) 利 用 前 人 开发 的 噪音 掩蔽 范式 (Manera, 


Giudice, et al., 2011) 初 步 考 察 了 社会 互动 ! 


是 否 向 小 人 B 传递 交流 的 意 


要 求 被 


预测 他 人 动作 的 神经 机 制 。 他 们 通过 操纵 小 人 A 


图 , 将 动画 分 为 互动 与 非 互 动 动画 ; 同时 将 小 人 B ARR Eri, 
试 判断 小 人 B 是 否 存在 。 结 果 发 现 ， 无 论 小 人 B 是 否 存 在 ， 互 动 动画 比 非 互 动 动画 


都 显著 的 增强 了 额 上 回 (superior frontal gyrus, SFG)， 相 反 则 激活 了 顶 上 小 叶 (superior parietal 


lobule, SPL), #1 F [=I (inferior temporal gyri, ITG) 等 属于 动作 观察 网 络 的 脑 区 ; 上 述 结果 表明 ， 


情景 下 大 脑 能 够 根据 小 人 A 的 动作 形成 对 小 人 B 动作 的 预期 ， 这 一 定 程度 上 减少 了 


在 互动 


执行 控 
B 不 存 


制 的 需求 进而 表现 出 动作 观察 
企 或 在 非 互动 动画 


网 络 激活 水 平 的 降低 。 当 违反 预期 时 ,， 即 在 互动 动画 中 


HB 存在 时 ， 右 侧 后 内 侧 额 回 (right posterior medial frontal gyrus, 


IPMFG)、 双 侧 模 前 叶 、 左 侧 小 脑 和 左 侧 梭 状 回 都 被 更 强 激活 ， 这 些 脑 区 可 能 与 社会 互动 中 


预测 仿 
动情 境 


复杂 的 


上 述 研究 发 现 了 表征 祝 


动作 表 


差 有 关 。 此 外 , 研究 还 发 现 杏 仁 核 的 激活 程度 可 以 预测 被 试 辨 别 B 的 能 力 , 并 且 在 互 


AAR RACKS mPFC 的 功能 连接 也 得 到 增强 ， 这 反映 了 对 互动 动作 的 预期 涉及 较 


社会 推断 ， 可 能 需要 整合 
-会 互动 认 知 特性 所 对 应 的 脑 区 , 为 揭示 整体 性 构 形 加 工 与 关联 性 
征 的 神经 机 制 提供 了 初步 的 方向 。 但 许多 重要 的 问题 还 有 待 回 答 , 如 依据 互动 发 起 者 


心智 化 网 络 的 功能 (Zillekens et al., 2019)。 


的 动作 激活 模式 是 否 可 以 解码 出 回应 者 的 动作 。 另 外 , WE FEE A hi ENE AT AES RIE A 
像 结 果 的 联系 从 而 更 准确 地 揭示 行为 与 脑 功能 的 关系 ， 如 EBA 的 激活 是 否 可 以 预测 整体 性 
构 形 加 工 任务 的 成 绩 并 且 反 映 知觉 社会 互动 的 个 体 差异 。 


4.2 社会 互动 加 工 的 特异 性 脑 区 

尽管 社会 互动 加 工 在 不 同 的 阶段 激活 了 众多 不 同 的 脑 区 , 但 有 些 脑 区 可 能 仅仅 参与 了 单 
个 人 的 身体 感知 和 动作 理解 , 因此 , 研究 者 试图 通过 更 精细 的 实验 设计 分 离 出 真正 能 表征 互 
动 关 系 的 特异 性 脑 区 。 在 一 个 以 猕猴 为 被 试 的 实验 中 ， 研 究 者 利用 功能 磁 共 振 成 像 技 术 


` 


= 


(functional magnetic resonance imaging, fMRD 考 察 狂 猴 在 观看 不 同 互 动 视频 时 全 脑 的 激活 


—_ 况 (Sliwa & Freiwald, 2017)， 结 果 发 现 只 有 内 侧 前 额 叶 以 及 IPL 的 部 分 脑 区 (对 应 于 人 类 的 心 
| 智 化 网 络 )， 特 异 于 加 工 猴 子 与 猴子 之 间 的 社会 互动 ， 而 对 猴子 与 物体 互动 、 物 体 与 物体 互 
动 的 视频 都 不 敏感 。 这 说 明 猕 猴 大 脑 中 存在 表征 社会 互动 关系 的 特异 性 脑 区 。 但是， 人 类 大 
脑 中 是 否 也 存在 类 似 的 脑 区 ? 研究 者 把 目光 聚集 到 了 pSTS， 它 不 仅 被 认为 是 个 体感 知 网 络 
的 脑 区 ， 也 经 常 被 看 作 动作 观察 网 络 和 心智 化 网 络 的 脑 区 (Deen, Koldewyn, Kanwisher, & 


Saxe, 2015; Yang, Rosenblau, Keifer, & Pelphrey, 2015)， 并 且 它 对 多 种 类 型 的 社会 刺激 都 有 反 
应 ,被 称 为 社会 大 脑 的 “中 枢 ”(Lahnakoskietal., 2012)。 为 了 进一步 排除 无 关 变 量 对 结果 的 
影响 ，Isik 等 人 (2017) 简 化 了 社会 互动 刺激 的 物理 属性 ， 只 保留 了 它们 的 互动 关系 。 他 们 发 
现 ， 由 简单 几何 图 形 所 组 成 的 互动 动画 (两 个 图 形 相 互 阻 碍 或 者 帮助 ) 比 物理 互动 (两 个 图 形 
相 撞 ) 或 单 人 动画 更 强 显 著 激 活 了 pSTS, 而 且 研 究 者 利用 MVPA 技术 , 通过 pSTS 的 激活 模 
式 可 以 区 分 出 互动 关系 是 相互 阻碍 还 是 帮助 。 该 实验 表明 pSTS 能 够 表征 社会 互动 关系 (类 


似 结果 见 Walbrin, Downing, & Koldewyn, 2018)， 可 能 是 加 工 社 会 互动 的 特异 性 脑 区 (Isik， 


Koldewyn, Beeler, & Kanwisher, 2017)。 但 值得 注意 的 是 ， 在 该 研究 中 pSTS 只 是 对 社会 互动 


反应 最 强 的 一 个 区 域 ， 它 的 边界 也 延伸 到 了 附近 表征 心理 理论 的 TPJ 区 域 和 功能 定位 的 动 
态 面 孔 脑 区 。 综 上 , 大脑 中 可 能 存在 真正 表征 社会 互动 关系 的 特异 性 脑 区 一 一 心智 化 网 络 及 
附近 的 pSTSCsik et al., 2017)， 这 些 脑 区 对 应 于 理解 双方 意图 及 心理 状态 的 加 工 阶段 。 


4.3 社会 互动 加 工 脑 区 的 功能 连接 


近年 来 , 一 些 研 究 者 从 层级 加 工 的 角度 出 发 ,进一步 探讨 不 同 脑 区 在 整个 加 工 过 程 中 的 
信息 传递 和 功能 连接 。 一 项 脑 成 像 元 分 析 的 研究 指出 ,在 社会 互动 加 工 中 ， 从 识别 个 体 的 动 
作 到 解析 单个 动作 和 互动 动作 的 意图 , 再 到 推断 动作 意图 背后 的 心理 状态 , 主要 激活 了 从 栖 


叶 中 后 部 皮层 经 pSTS 传 向 TPJ 的 通路 (Arioli & Canessa, 2019)。 其 中 ，pSTS 很 可 能 是 社会 


互动 加 工 过 程 中 的 重要 节点 ， 起 着 对 信息 进行 分 类 筛选 并 向 其 它 脑 区 传输 的 作用 (Sliwa & 


Freiwald, 2017)。 因 此 ，pSTS 与 其 它 脑 区 的 功能 连接 也 可 能 会 受到 入 


会 互动 类 型 的 调节 。 在 


需要 理解 动作 的 共同 意图 时 ， 比 如 两 个 人 合作 搬 箱子 ，pSTS 增强 了 与 动作 观察 网 络 中 的 顶 


上 小 叶 (superior parietal lobule, SPL) 和 上 腹 侧 PMC 的 连接 ， 而 在 需要 理解 情绪 的 互动 中 ， 比 如 


oe 


两 个 人 微笑 着 牵手 ，pSTS 则 增强 了 与 心智 化 网 络 中 vmPFC 的 连接 (Arioli et al.,2018). A Bil 


有 关 功 能 连接 的 研究 只 是 刚刚 起 步 , 未 来 需要 更 多 的 数据 来 全 面 刻 画 不 同 阶段 和 不 同类 型 的 


社会 互动 加 工 所 依赖 的 功能 连接 模式 ， 并 揭示 关键 节点 如 pSTS 在 社会 互动 信息 传递 中 的 作 


用 。 


5 总 结 与 展望 
在 社会 环境 中 , 他 人 的 社会 互动 为 我 们 提供 了 丰富 的 社会 信息 ， 


所 以 检测 和 识别 社会 互 


动 信息 是 十 分 重要 的 。 这 种 重要 性 使 得 社会 互动 同 面 孔 和 生物 运动 一 样 ， 人 类 对 其 具有 较 高 
的 敏感 性 ， 并 表现 出 对 社会 互动 的 加 工 优 势 : 相 比 于 非 社 会 互动 刺激 ,会 优先 加 工 社会 互动 
刺激 ; 识别 与 记忆 社会 互动 刺激 的 能 力也 更 强 。 人 类 对 社会 互动 整体 性 构 性 加 工 和 关联 性 动 


个 体感 知 网 络 、 动 作 观察 网 络 和 心智 化 网 络 (Quadflieg & Koldewyn, 


乍 表征 是 构成 其 加 工 优势 的 深层 原因 。 社 会 互动 是 一 个 层级 加 工 过 程 , 所 涉及 的 脑 网 络 包 括 


2017)。 对 于 社会 互动 加 


工 的 认 知 特性 来 说 ， 初 步 的 研究 显示 EBA 参与 社会 互动 的 整体 性 构 形 加 工 ， 而 动作 观察 网 


络 和 心智 化 网 络 的 一 些 脑 区 则 与 关联 性 动作 表征 有 关 。 尽 管 存在 菜 些 特定 的 脑 区 对 社会 互动 


关系 更 为 敏感 , 但 是 各 个 脑 区 在 不 同 加 工 阶段 的 信息 传递 和 相应 的 功能 连接 对 于 完成 社会 互 


动 加 工 也 同样 重要 (Arioli & Canessa, 2019)。 总 结 来 看 ， 尽 管 研究 者 对 社会 互动 加 工 进 行 了 多 


方面 的 探索 ， 但 还 有 一 些 有 待 解决 的 问题 。 


第 一 ， 人 类 能 够 快速 探测 到 社会 互动 信号 ， 正 确 解读 他 人 的 动作 含义 ， 但 这 种 能 力 是 否 
并 


mo 


来 自 先 天 遗传 还 未 有 定论 。 研 究 显 示 ，5~14 SASL DEH 
两 侧 同 时 呈现 互动 和 非 互 动 的 动画 时 ， 他 们 对 互动 动画 的 注视 时 


[会 互动 的 信息 ， 当 屏幕 


间 更 长 (Galazka, Roche, 


Nystrom, & Falck-Ytter, 2014)， 而 且 在 两 个 个 体 动 态 追 逐 的 动画 中 ， 他 们 的 目光 注视 “ 追 " 的 


个 体 时 间 显 著 长 于 “ 逃 " 的 个 体 和 不 参与 互动 的 个 体 (Galazka & Nystrom, 2016)。 这 说 明 不 到 1 
岁 的 婴儿 已 经 对 环境 中 的 互动 信息 及 引发 互动 的 个 体 表现 出 更 多 的 兴趣 , 表明 这 种 能 力 可 能 
是 人 类 在 进化 过 程 中 通过 自然 选择 而 保留 下 来 , 因此 具有 一 定 的 遗传 性 。 未 来 可 通过 行为 遗 
传 学 的 方法 ， 比 如 双生 子 实验 (Wang etal., 2018)， 对 社会 互动 的 遗传 特性 提供 更 为 直接 的 证 
据 。 


第 二 ， 以 往 的 很 多 研究 都 指出 ， 人 类 对 诸如 面孔 、 生 物 运 动 等 传递 出 大 量 生物 性 和 社会 
性 信息 的 刺激 都 具有 整体 加 工 优势 , 即 加 工 依赖 于 各 个 部 分 之 间 的 空间 结构 关系 并 表现 出 经 
典 的 倒置 效应 (Farah, Tanaka, & Drain, 1995; Reed, Stone, Bozova, & Tanaka, 2003)。 相 比 于 精 
细 的 轮廓 线 等 具有 较 高 空间 频率 的 信息 , 较为 粗略 的 整体 结构 体现 在 刺激 低空 间 频 率 的 信息 
P, 且 加 工 速度 快 于 高 频 信 息 , 因此 这 种 整体 加 工 优势 通常 被 认为 只 存在 于 刺激 的 低频 信息 
(Goffaux et al., 2011)。 与 面孔 和 生物 运动 类 似 ， 社 会 互动 也 以 整体 构 形 的 方式 被 加 工 ， 并 且 
传递 出 重要 的 社会 性 信息 , 具有 进化 意义 。 所 以 社会 互动 的 整体 构 形 可 能 特异 于 互动 刺激 的 
低频 成 分 ， 从 而 表现 出 相对 于 非 互动 刺激 的 加 工 优势 。 但 是 ， 上 述 推断 是 否 正确 还 需要 进 


步 的 实验 进行 探究 。 
第 三 , 相关 脑 机 制 的 研究 已 经 表明 社会 互动 加 工 是 一 个 层级 加 工 过 程 。 尽 管 现 有 的 研究 


揭示 了 动作 观察 网 络 、 心 智 化 网 络 和 pSTS 在 社会 互动 加 工 中 的 作用 (Arioli & Canessa, 2019; 


Sliwa 久 Freiwald,2017)， 但 无 论 是 从 社会 互动 认 知 特性 的 脑 机 制 ， 特 噶 性 脑 区 ， 还 是 脑 区 之 
间 功 能 连接 的 角度 ， 仍 有 许多 问题 值得 探索 。 比 如 ,在 预测 他 人 动作 时 ， 相 应 脑 区 的 功能 连 
接 是 否 随 互动 的 进程 而 动态 变化 ，pSTS 是 否 具 有 筛选 和 传递 社会 互动 信息 的 功能 ; 不 同类 
型 社会 互动 的 脑 机 制 有 多 大 的 异同 (Canessa et al., 2012; Sinke et al., 2010)， 是 否 依赖 于 不 同 
的 功能 连接 模式 (Arioli et al., 2018) 等 等 。 最 后 ， 虽 然 本 文 主要 关注 “第 三 人 称 ” 社 会 互动 的 
加 工 ， 但 随 着 多 人 脑 神经 活动 同步 记录 技术 (hyperscanning) 的 发 展 ， 人 与 人 之 间 实 时 互动 的 
脑 机 制 正 逐渐 成 为 “第 二 人 称 ” 社 会 互动 研究 的 重点 (Kingsbury & Hong, 2020)。 然 而 ， 目 
前 直接 对 比 两 种 视角 下 社会 互动 加 工 的 研究 还 较 少 , 未 来 可 结合 多 种 技术 手段 探索 它们 在 脑 
机 制 上 的 异同 。 


最 后 ,目前 的 研究 多 集中 于 对 社会 互动 的 认 知 及 神经 机 制 的 探讨 ,未 来 可 以 多 发 掘 社会 
互动 加 工 的 应 用 价值 。 已 有 多 项 证 据 表 明 茶 些 疾 病 患者 的 社会 互动 加 工 能 力 会 受到 损害 


(Centelles, Assaiante, Etchegoyhen, Bouvard, & Schmitz, 2013; Kuschefski, Falter-Wagner, Bente, 


Vogeley, & Georgescu, 2019; Okruszek et al., 2015; Walter et al., 2009)， 例 如 ， 高 功能 自 闭 症 患 


者 无 法 利用 动作 关联 性 预测 他 人 的 动作 (von der Luhe et al., 2016)， 而 精神 分 裂 症 患者 虽然 表 
征 关 联 性 动作 的 能 力 没 有 受到 损伤 ， 但 却 表 现 出 对 社会 互动 中 生物 运动 识别 能 力 的 下 降 


(Okruszek, Piejka, Wysokinski, Szczepocka, & Manera, 2018, 2019)。 未 来 可 利用 更 具有 生态 效 


度 的 虚拟 现实 技术 来 探索 这 些 疾病 患者 加 工 社会 互动 的 认 知 特性 , 并 为 相关 疾病 的 诊断 及 干 
预 提供 新 的 思路 。 此 外 ,利用 人 工 智能 识别 现实 场景 中 人 与 人 的 互动 行为 , 例如 在 公共 场所 
对 可 疑 群体 的 检测 ， 也 具有 重要 、 广 阔 的 应 用 前 景 。 
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The cognitive characteristics of and the brain mechanisms underlying 
social interaction processing from a third-person perspective 
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Abstract: The ability to recognize and decipher social interaction of others from a third-person 
perspective is critical for our daily life. There are two cognitive characteristics accounting for the 
processing of social interaction: configural integrity and action contingency. A hierarchical neural 
basis underpins social interaction processing in which the person perception network, the action 
observation network and the mentalizing network are concurrently engaged, wherein the posterior 
superior temporal sulcus plays a crucial role. Future research needs to explore the heredity of social 
interaction, to elucidate its underlying cognitive and neural mechanism by combining various 


technological methods, and to focus on its application in real life. 
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